Apprentissage de Concept à partir d’Exemples (très) Ambigus
نویسندگان
چکیده
Résumé : Dans cet article nous explorons l’incomplétude des données dans le cadre de l’apprentissage de concepts propositionnels. Nous suivons l’idée de H. Hirsh qui étend le paradigme de l’espace des versions : dans cette extension une hypothèse doit être compatible (dans un sens à définir au cas par cas) avec toutes les informations relatives aux exemples. Nous proposons une représentation de ces informations qui rend non seulement compte de situations où les données sont manquntes mais aussi de situations plus générales d’ambiguité dans lesquelles l’exemple est caché au sein d’un ensemble d’instances virtuelles. Nous présentons un nouvel algorithme, LEa, qui apprend un concept DNF (monotone) existentiel à partir d’un ensemble d’exemples ambigus. Nous comparons LEa à J48 et Naive Bayes sur des problèmes usuels rendus incomplets à divers degrés. Mots-clés : Apprentissage de concepts propositionnels, Ambiguité, Données incomplètes.
منابع مشابه
Apprentissage de structure des réseaux bayésiens et données incomplètes
Résumé. Le formalisme des modèles graphiques connait actuellement un essor dans les domaines du machine learning. En particulier, les réseaux bayésiens sont capables d’effectuer des raisonnements probabilistes à partir de données incomplètes alors que peu de méthodes sont actuellement capables d’utiliser les bases d’exemples incomplètes pour leur apprentissage. En s’inpirant du principe de ams-...
متن کاملIdentification à la limite de langages dans le cadre d’un bruit systématique
Pour étudier l’apprentissage à partir de données bruitées, il est usuel de se baser sur un modèle de bruit statistique. L’influence du bruit est alors envisagée selon des critères pragmatiques ou eux-mêmes statistiques, en se basant donc sur un paradigme prenant en compte une distribution des données. Dans cet article, nous étudions le bruit comme un phénomène non statistique, en définissant la...
متن کاملLogiciel d'aide à l'étiquetage morpho-syntaxique de textes de spécialité
Résumé. La compréhension de textes de spécialité nécessite un étiquetage morpho-syntaxique de bonne qualité. Or, lorsque les textes étudiés sont issus de domaines spécifiques et peu usités, il est rare de disposer de dictionnaires et autres ressources lexicales fiables. Le logiciel que nous proposons permet d’utiliser un étiquetage réalisé par un étiqueteur généraliste, puis d’améliorer cet éti...
متن کاملApprentissage de scénarios à partir de séries temporelles multivariées
La construction automatique de scénarios à partir des signaux (séries temporelles) produits par les appareils de surveillance de patients en anesthésie réanimation est le premier pas vers l’élaboration de systèmes de monitoring intelligent. Mais dans ce contexte, les connaissances a priori ne sont pas suffisantes pour orienter efficacement un apprentissage à partir des données complexes que son...
متن کاملA Study on Learnability for Rigid Lambek Grammars
We present the basic notions of Gold’s learnability in the limit paradigm, a formalization of the cognitive process by which a native speaker infers the rules of the grammar of her own native language through the exposition to a finite sample of sentences generated by that grammar. Then we present Lambek grammars, a formalism issued from categorial grammars which, although not as expressive as ...
متن کامل